1
ข้ามจุดหยุดการเรียนรู้: เหตุผลที่โมเดลภาษาขนาดใหญ่ต้องอาศัยความรู้ภายนอก
AI025Lesson 1: Foundations of RAG and Knowledge Base Construction
00:00

โมเดลภาษาขนาดใหญ่สามารถสร้างภาษาได้อย่างลื่นไหล แต่ ความคล่องตัวไม่เท่ากับความถูกต้องตามหลักข้อเท็จจริงข้อจำกัดพื้นฐานของโมเดลภาษาขนาดใหญ่คือการพึ่งพา หน่วยความจำแบบพารามิเตอร์—ซึ่งเป็นความรู้ที่ถูกล็อกไว้ในช่วงเวลาที่การฝึกอบรมสิ้นสุดลง ซึ่งเรียกว่า 'จุดหยุดการเรียนรู้'

หน่วยความจำแบบพารามิเตอร์ค่าน้ำหนักที่ถูกล็อกจุดหยุด: ธ.ค. 2023ความเสี่ยงในการเล่าเรื่องโดยผิดสถาปัตยกรรมแบบ RAGหลักฐานที่เปลี่ยนแปลงได้แบบเรียลไทม์ / ส่วนตัวการยึดมั่นในหลักฐาน

เหตุผลที่โมเดลภาษาขนาดใหญ่ล้มเหลวเมื่ออยู่คนเดียว

RAG มีอยู่เพราะคำถามที่เกิดขึ้นจริงหลายข้อต้องอาศัยข้อมูลที่เป็น ส่วนตัว, ล่าสุด, มีเวอร์ชัน, เฉพาะด้านหรือ ตรวจสอบได้หากไม่มีความรู้ภายนอก โมเดลจะมีข้อจำกัดดังนี้:

  • ข้อจำกัดด้านเวลา: ไม่สามารถทราบเหตุการณ์ที่เกิดขึ้นหลังจากการฝึกอบรม
  • ข้อจำกัดด้านการเข้าถึง: ไม่มีการมองเห็นข้อมูล 'ลับ' (เอกสารส่วนตัวขององค์กร)
  • ข้อจำกัดด้านการติดตามแหล่งที่มา: ขาดเส้นทางการตรวจสอบเพื่อความรับผิดชอบในเชิงวิชาชีพ
แนวทางแบบเปิดตำรา
แทนที่จะบังคับให้โมเดล 'จำ' ทุกอย่างผ่านการฝึกใหม่ที่มีต้นทุนสูง เราจะเปลี่ยนสถาปัตยกรรมให้ดึงหลักฐานเฉพาะจากชุดข้อมูลภายนอกก่อน แล้วให้โมเดลตอบคำถามพร้อมกับหลักฐานที่เห็นอยู่ ซึ่งทำให้เกิด ความมั่นใจที่มีหลักฐานรองรับ มากกว่าความมั่นใจโดยไม่มีหลักฐาน